03. Datalab

  • 현재 베타버전이라 항상 바뀔 수 있음!
  • EDA, 시각화, 분석까지 할 수 있는! 쥬피터 노트북이라고 보면 편함
  • 현재 Python 2점대 버전만 지원
  • 가상 컴퓨터를 사용해 작업ㄴ
  • Docker를 사용..!
  • Use notebooks with Python, TensorFlow Machine Learning, and Google Analytics, Google BigQuery, and Google Charts APIs

  • 현재 빅쿼리와는 연결할 수 있으나, 빅테이블엔 연결할 수 없음!!

Local Install

  1. Docker 1.12.0 이후 버전 설치(Docker Toolbox는 지원하지 않아요..)
  2. 프로젝트 생성 및 선택
  3. gcloud projects list 입력 ( gcloud 다운 필요 )
  4. Dokcer에서 Shared Drives -> C 공유
  5. Windows에선 환경변수 추가 필수 : 링크
  6. 시작할 곳 선정 (??)
  7. Docker에서 datalab 시작하기
    docker run -it -p "127.0.0.1:8081:8080" \
    -v "/C/Users/<username>/Documents/:/content" \
    -e "PROJECT_ID=<PROJECT_ID>" \
    gcr.io/cloud-datalab/datalab:local

Datalab 실행

  1. Docker 에서 datalab 실행
  2. 그 후 http://localhost:8081 이동
  3. (첫 접속이라면) Terms of Service 승인
  4. 사용..!

DATAlab 실행 - 2번째 방법

  1. Terminal에서 datalab connect datalab

In [ ]:
import datalab.bigquery as bq
import pandas as pd

In [ ]:
%%sql --module test
SELECT
    id, country,
FROM
    TABLE
WHERE
    조건
GROUP EACH BY
  id,
  country,
LIMIT
  100

In [ ]:
my_data_frame = bq.Query(test).to_dataframe()